翻訳と辞書 |
GB 18030[じーびー18030]
GB 18030は、中華人民共和国(中国)が制定した文字コード(文字セット)の国家規格である。規格名は現在 () といい、当初は () といった。IANA登録名はGB18030である。 == 概要 == 正式な規格として制定されることのなかったそれまでの拡張文字セットGBKに代わる上位集合であり、互換性も維持している。GB 18030は漢字のほかに少数民族言語の文字をサポートする。漢字は、中華人民共和国の規範漢字である簡体字のほか、Unicodeに含まれる繁体字や日本、韓国などで使われる漢字をも含む。 この規格の初版は信息産業部電子工業標準化研究所により起草され、国家質量技術監督局により2000年3月17日に発布された。現行の版は、国家質量監督検験検疫総局と中国国家標準化管理委員会によって2005年11月8日に発布され、2006年5月1日に実施されている。いずれも規格票は中国標準出版社から出版された。この規格のサポートは、中国で販売されるすべてのソフトウェア製品に対して義務づけられている。 GB 18030は従来の文字コードと互換性を維持したUnicode伝送形式(Unicode Transformation Format、すなわちすべてのUnicode符号位置を符号化する文字符号化方式)であるとみなせる。言いかえると、GB 18030はUTF-8(ASCIIと互換性を維持している)の中国版である。UTF-8と同様、GB 18030はASCIIの上位集合でありUnicode符号位置の範囲全体を表現できる。加えて、GB 18030はGB 2312の上位集合でもある。GB 18030は、GB 2312の拡張であるGBKとの互換性も維持している。ただしユーロ記号については、GBKのマイクロソフトによる実装であるコードページ936の後期バージョンで1バイト符号の0x80を割り当てたのに対し、GB 18030では2バイト符号のA2 E3を割り当てている。 マッピングデータの一部は (GBKと同様)変換表に基づく。残りは計算で求められる。GB 18030はその基となった古い規格の悪い側面も継承している。最も目立つのは、GB 18030のシーケンスからASCII文字を安全に検索するには特別なコーディングが必要なことである。 ほとんどの主要なコンピュータ企業は、各社のバイナリ形式やOS呼び出しで使うための基本的な形式として何らかのバージョンのUnicode上ですでに標準化を行っていた。しかし、ほとんどの場合Unicode 1.0で当初から定義されていた基本多言語面 (BMP) の符号位置しかサポートしていなかった。BMPは65,536の符号位置しかサポートしておらず、しばしば16ビットでUCS-2として符号化された。 ソフトウェアのUnicodeサポートが重要になっていくにつれて、中国はBMP外の特定の符号位置サポートを義務づけることを決定した。これは、ソフトウェアはもはや文字を16ビット固定長の存在 (UCS-2) であるとみなしてお茶を濁せなくなったことを意味する。そのため、UTF-8やUTF-16のような可変幅形式のデータを処理するか、より大きなUCS-4やUTF-32のような固定幅形式に移行するかのどちらかを行わなければならなくなった。マイクロソフトはWindows 2000でUCS-2からUTF-16への変更を行った。
翻訳と辞書 : 翻訳のためのインターネットリソース |
Copyright(C) kotoba.ne.jp 1997-2016. All Rights Reserved.
|
|